home *** CD-ROM | disk | FTP | other *** search
/ ShareWare OnLine 2 / ShareWare OnLine Volume 2 (CMS Software)(1993).iso / demos / russoft1.zip / INTERREC.ZIP / README.ENG < prev    next >
Text File  |  1992-07-12  |  19KB  |  392 lines

  1.         Optical character recognition system InterRec
  2.                          Version 1.0
  3.  
  4.                         User's Manual
  5.  
  6.      1. Purpose of the InterRec system
  7.      The InterRec  system  of optical character recognition is
  8. intended for the recognition of texts entered into  a personal
  9. computer  with  the aid of any kind of equipment for the input
  10. of optical information.
  11.      The source material for InterRec's  work  is  a  graphics
  12. file  of  the  text  aquired  with the aid of a device for the
  13. input of optical information and stored on a hard  disk  or  a
  14. diskette in PCX format (two colors).
  15.      The result of the system's work is a file  containing the
  16. ASCII representation of the source graphics image of the text.
  17.  
  18.      2. General information
  19.      InterRec is  an omnifont system.  This means that it does
  20. not need any kind of setup or teaching for the  recognition of
  21. a specific font.
  22.      The text being processed must me written  in  a  graphics
  23. file  with  a resolution not less that 200 pixels per inch.  A
  24. resolution  of  300  dots  per  inch  is  recommended,   which
  25. increases  the  accuracy of recognition (with an insignificant
  26. increase in processing time).
  27.      The character height must be within the following limits:
  28.      for a resolution of 200 pixels per inch:  6 to 50  points
  29.      (2.2 to 19 mm);
  30.      for a resolution of 300 pixels per inch:  4 to 30  points
  31.      (1.5  to  11  mm).
  32.      The system   has   modes   of    operation    that    are
  33. user-selectable:  ENGLISH  and  RUSSIAN for the recognition of
  34. texts in the English and Russian languages respectively.
  35.      When working  in the ENGLISH mode InterRec recognizes the
  36. capital and small letters of the English alphabet, numbers and
  37. the following symbols:  !  ?  . , : ; " / $ % & * ( ) - + = in
  38. vertical and italics, in normal and wide lines.
  39.      When working in the RUSSIAN mode InterRec  recognizes the
  40. capital and small letters of the Russian alphabet, numbers and
  41. the following symbols:  !  ?  .  ,  :  ;  " / % * ( ) - + = in
  42. vertical, in normal and wide lines.
  43.      In both  modes  InterRec recognizes letters,  numbers and
  44. the above listed special symbols printed in proportional fonts
  45. on   a   laser   printer,   on   a   dot  matrix  printer  (in
  46. near-letter-quality mode), on a typewriter or on a typesetting
  47. machine.
  48.      To guarantee that the system works correctly,  there must
  49. not  be  any characters other than those listed above,  or any
  50. underlines.  The  presence  of  any  tables  or  such  graphic
  51. elements such as drawings,  sketches or graphs may lead to the
  52. rejection of the entire page for character recognition.
  53.      The accuracy of recognition depends on the quality of the
  54. graphics copy of the text and with high-quality of the  source
  55. material  attains  99%.  The accuracy of recognition decreases
  56. with the presence of a large number of joined  characters, and
  57. also  with  the  presence  of  breaks in the representation of
  58. characters.
  59.      The time for recognizing one page (2000  characters) does
  60. not  exceed  1.5  minutes (with a resolution of 300 pixels per
  61. inch and using an IBM PC AT with a clock speed of 12 Mhz).
  62.      The requirements  for a personal computer are any machine
  63. that is compatible with an IBM PC XT/AT with not less than 512
  64. Kbytes of real memory and an EGA or VGA video adapter. A mouse
  65. makes the work with the system more comfortable,  though it is
  66. not a  required  device.  The operating  system must be MS-DOS
  67. version 3.3 or higher.
  68.  
  69.      3. The complete set
  70.      A 5.25" DS/DD diskette containing:
  71.      the program interrec.exe (intrdemo.exe for  demo version)
  72.      and  the  files  needed  to  work  with  it:  eng.trr and
  73.      rus.trr;  the instruction files for the user  in  English
  74.      (readme.eng)  and  in  Russian  (readme.rus);  files that
  75.      let  you  read  the  files containing  recognized Russian
  76.      texts   on   the   screen   (egarfont.com,  vgarfont.com,
  77.      egarfont.fnt, vgarfont.fnt).
  78.  
  79.      The  demo version of InterRec system  does not  write the
  80. recognized text into the file. Therefore you do not  need  the
  81. files egarfont.com, vgarfont.com, egarfont.fnt, vgarfont.fnt.
  82.  
  83.      4. How to work with InterRec
  84.      The EXE file used to load and start the program is called
  85. interrec.exe.
  86.      After startup, a window containing some brief information
  87. about the system is displayed on the screen. To enter the main
  88. menu you must press any key  on  the  keyboard  or  any  mouse
  89. button.
  90.      The main menu displays the system control functions which
  91. are divided into four groups corresponding  to  the  following
  92. items of the main menu:  File,  Screen,  Language,  Start.  To
  93. invoke a function of the main menu you should either
  94.      (a) place  the  highlighted  bar on the selected function
  95.          using the left and right arrow keys,  and  press  the
  96.          Enter key;
  97.      (b) move the mouse cursor to the necessary item and press
  98.          twice  the  left button of the mouse (after the first
  99.          click the highlighted bar will move to  the necessary
  100.          item).
  101.      Submenu items, falling out of the main menu, are selected
  102. in  the  same  way  but  using  the up and down arrow keys. To
  103. return  from submenu items to the main menu you should either:
  104.      (a) press Esc;
  105.      (b) press the right  button of the mouse if its cursor is
  106.          within  the submenu, or press the  left button if the
  107.          cursor is outside this area.
  108.  
  109.      Now, let us discuss one by one the functions  of the  main
  110. menu.
  111.  
  112.      4.1. File
  113.      The purpose of this function is to select both a name for
  114. the file which stores the graphic  image  of  the  text  being
  115. recognized,  and a name of the file which will store the ASCII
  116. representation of the text.  Here the  exit  control  is  also
  117. located.  Accordingly,  the submenu has three items: Load.PCX,
  118. Load.TXT, Exit.
  119.  
  120.      4.1.1. Load.PCX.
  121.      This item  is  used  to  select  the  name  of  the  file
  122. containing graphics image of the text being  recognized.  This
  123. file must have the .PCX extension.
  124.      When  you select this option, a dialog box appears in the
  125. center  on  the  screen in which you can see: an input line; a
  126. scroll  window,  where  the file to be recognized is searched;
  127. and buttons labeled Ok and Cancel.
  128.      If using a keyboard, you must continuously  press the Tab
  129. key to transfer control between the input line,  Ok and Cancel
  130. buttons.
  131.      While entering  the  system,  the input line displays the
  132. name of the directory where InterRec is located,  and  a  .PCX
  133. searching mask.
  134.      The  input  line  has  7 lines. A line designated as .. \
  135. lets  you  call  up  the  directory  of  the higher level. The
  136. remaining  lines  contain  filenames  of the current directory
  137. corresponding  to  the  mask  ,  i.  e.  filenames  with . PCX
  138. extension, and also subdirectory names. If these filenames and
  139. subdirectory names are rather numerous and cannot be displayed
  140. simultaneously  in the given lines, use the scrolling function
  141. to  view  them all. You should either press the down arrow key
  142. or  move  the mouse cursor to the down arrow of the scroll bar
  143. and press the left button of the mouse.
  144.      Reverse scrolling is performed either with the  up  arrow
  145. key  or  by  moving  the  mouse  cursor to the up arrow of the
  146. scroll bar and pressing the left button of the mouse.
  147.      You may also enter the directory you need (and change the
  148. current drive if necessary) by direct input of the pathname in
  149. the input line.  To open this line for writing down,  you  can
  150. use the following ways:
  151.      (a) if using a keyboard, press the Tab key until a cursor
  152.          in the form of an underline appears in this line;
  153.      (b) if  using a mouse, move the mouse cursor to this line
  154.          and press the left button of the mouse.
  155.      The  underline  cursor points to the position in the line
  156. where you will start typing. You can move the cursor along the
  157. line using the left and right arrow keys. You can type both in
  158. replace  and  insert  modes.  The  modes are switched with the
  159. Insert key.  Finally, you must press the Enter key.
  160.      There are two ways to select a filename  for recognition:
  161.      (a) move the highlighted bar using  the up and down arrow
  162.          keys and press the Enter key;
  163.      (b) move  the  mouse  cursor to the  appropriate item and
  164.          press  the left button of the mouse twice (after  the
  165.          first  click  the  highlighted  bar  will move to the
  166.          appropriate item).
  167.      The  selected  filename  will  be  displayed on the input
  168. line.  To proceed, you have to confirm the correctness of your
  169. choice.  This is performed in the following ways:
  170.      (a) if using a keyboard, activate the Ok button  with the
  171.          aid  of the Tab key, as stated above (doing this, the
  172.          letters "Ok" will change to red), and  finally  press
  173.          the Enter key;
  174.      (b) if  using a mouse, move  its  cursor to the Ok button
  175.          and press the left button of the mouse.
  176.  
  177.      After this   the  dialog  box  will  disappear,  and  the
  178. following record in the upper line of the screen will appear:
  179.      Recognition  from  full  pathname  and  name  of the file
  180. selected  for  recognition  to  full pathname and filename for
  181. storing ASCII code of the recognized text.
  182.      The system itself prompts you to save the recognized text
  183. in a file in the same  directory as  the  original  file,  and
  184. which  retains  the  name  of  the  original  but  with  a new
  185. extension: .TXT.  If the full pathnames are  too  long  to  be
  186. contained  within  one  line,  only  the  head  parts  of  the
  187. pathnames (that is,  the name of the current drive) as well as
  188. the tail parts of it (that is,  the filenames) are displayed.
  189.      In  addition,  in  the  window  in  the lower part of the
  190. screen  where there is a scroll bar, the image of the graphics
  191. file selected for recognition (or its fragment) will appear.
  192.      Shading  in  horizontal  and/or vertical scales indicates
  193. that  the  graphics file is too large to be fully displayed in
  194. the  window.  Nevertheless,  the  system  lets  you  view  the
  195. remaining  parts  of  the graphics file. The displayed area is
  196. moved along the file in the following ways:
  197.      (a) if  using  a keyboard, press  the left, right, up and
  198.          down keys;
  199.      (b) if  using a mouse, move  the  pointer to the  desired
  200.          scroll bar arrows and pressing the left button.
  201.      To switch control from the mouse to the keyboard and vice
  202. versa you should use the Tab key.
  203.      Unshaded areas on the scroll bar show the location of the
  204. displayed fragment in relation to the whole page.
  205.      If you are satisfied with the name and  location  of  the
  206. ASCII file which have been proposed to you by the system, your
  207. work with the File item of main  menu  is  completed.  If  the
  208. choice  proposed  to you by the system does not suit you,  you
  209. should select the Load.TXT  second option.
  210.      Job in the dialog box can be cancelled prior to selecting
  211. a file for recognition.  It can be done in the following ways:
  212.      (a) if  using  a  keyboard, activate the Cancel key using
  213.          the  Tab  key  until  the  word  "Cancel"  turns red,
  214.          and then press Enter;
  215.      (b) if using a mouse, move its arrow to the Cancel button
  216.          and press the left button of the mouse.
  217.  
  218.      4.1.2. Load.TXT
  219.      This  item is used  to select  the  filename  which  will
  220. contain   the  recognized  text.
  221.      The selection of  the  appropriate  file  for  the  ASCII
  222. representation   is   done  following  the  same  sequence  of
  223. operations as that  for  the  graphics  file.  Extension  .TXT
  224. should  be  used  instead  as a search mask ,  and the current
  225. directory must be the one  where the file to be recognized was
  226. selected.  The  mask  can be changed by inputting the required
  227. extension in the input  line  as  in  4.1.1.  After  you  have
  228. approved  the  selection,  the  pathname  and filename will be
  229. displayed in the upper line of the screen.
  230.      ASCII representation  can  be  stored  in  a newly opened
  231. file. To do so you must type its name in the input line, press
  232. the  Enter  key  and confirm your choice (Ok) as stated above.
  233. The pathname and the filename will be displayed in  the  upper
  234. line of the screen.
  235.      After  selecting the files for recognition and saving the
  236. ASCII representation, you should check the correctness of your
  237. choice. If you are satisfied, your work with the File function
  238. is completed; otherwise, you need to return to the appropriate
  239. function  (Load.  PCX  or  Load. TXT) and make a new selection
  240. following the above sequence of operations.
  241.  
  242.      4.1.3.  Exit
  243.      Entering  this  item results in exiting from the InterRec
  244. system.
  245.  
  246.       4.2.  Screen
  247.      This item is used to select the form in which information
  248. is displayed on the screen in the  recognition  process.  Thus
  249. the submenu has three items: Graphics, All, ASCII.
  250.  
  251.      4.2.1.  Graphics
  252.      When item Graphics is selected,  the window  for  viewing
  253. graphics  file  increases  in size.  In this enlarged window a
  254. graphics file can be viewed in  the  same  way  as  in  4.1.1.
  255. During  recognition process the graphics file will be scrolled
  256. in the window.  The recognition results will not be displayed.
  257.  
  258.      4.2.2.  All
  259.      With choosing  this  item the windows do not change their
  260. positions on the screen.  In the recognition process the lower
  261. window displays graphics file being scrolled,  and the upper -
  262. the resulting text file.
  263.      This mode  is  set  by  default if the Screen item of the
  264. main menu is not invoked.
  265.  
  266.      4.2.3.  ASCII
  267.      Upon entering this item the whole screen will be used for
  268. a large window for demonstration of recognition results, i. e.
  269. the  resulting  ASCII  file.  This  mode  is  faster  than the
  270. previous one.
  271.  
  272.      4.3.  Language
  273.      This   item  lets  you  switch  operating  modes  of  the
  274. recognition program with regards to the language of the source
  275. text.  The selected mode is marked with a tick. English is the
  276. default language.
  277.      The text editor must have an appropriate screen driver to
  278. let you read the files containing the recognized Russian text.
  279. If  your  text  editor  has  no  such driver, use the enclosed
  280. drivers  that  come with the InterRec system. To use them, you
  281. must  start  egarfont.com  (with  an  EGA  video  adapter)  or
  282. vgarfont.com  (with a VGA video adapter)  before you work with
  283. the editor.  The character  coding used by the system is given
  284. in Appendix.
  285.  
  286.      4.4.  Start
  287.      This item  of the main menu has no submenu and is used to
  288. start the recognition program.
  289.      If a  file  selected  for  ASCII  representation  already
  290. exists, the following message will appear on the screen:
  291.  
  292.                   ASCII file already exists
  293.                   New       Add      Cancel
  294.  
  295.      While  using  a  keyboard,  the required item is selected
  296. with  the  left  and right arrow keys followed by pressing the
  297. Enter key.  The selected item changes to red.
  298.      If you chose the New option, the previous contents of the
  299. text  file  will  be  lost.  If  the Add item is selected, the
  300. recognition  result is added to the contents of the file. This
  301. mode  of  operation  can  be  effectively  used if you want to
  302. combine  into a single file the results of processing multiple
  303. sheets. As soon as you select an item, recognition will begin.
  304. Information  will  be  displayed  on  the  screen  as  it  was
  305. described in 4.2. The unshaded area in the vertical scroll bar
  306. corresponds to the page fragment being recognized.
  307.      Recognition will not start if the Cancel item was chosen.
  308.      Program  execution  can  be cancelled by pressing Esc.
  309.      Upon the program termination a message will appear on the
  310. screen:          Successful recognition.
  311.  
  312.      5. Possible User Errors
  313.  
  314.      The system  provides  you  with several of messages which
  315. indicate possible incorrect actions of the user.
  316.  
  317.      5.1.  File can't be opened
  318.      This message appears when a non-existing file is selected
  319. for recognition.
  320.  
  321.      5.2.  Invalid drive or directory
  322.      The message indicates that while selecting the file,  the
  323. user has typed wrong name of the drive or directory.
  324.  
  325.      5.3.  This disk can't be set
  326.      The message indicates that,  when trying to open a  file,
  327. the user has typed the name of a non-existing drive.
  328.  
  329.      5.4.  Data reading error
  330.      This message appears when an error occurs in reading from
  331. the disk.
  332.  
  333.      5.5.  Invalid PCX format
  334.      The message  indicates  that  the   file   selected   for
  335. recognition does  not  meet  the  requirements  of PCX format,
  336. version 2.8 and lower.  In this case you need to form the file
  337. for recognition anew.
  338.  
  339.      5.6.  Not compatible format
  340.      The message testifies to the fact, that a file with color
  341. or gray-scale image,  not supported by current system version,
  342. was selected for recognition.
  343.  
  344.      5.7. Graphic file not loaded
  345.      This message  appears at the attempt to start recognition
  346. when the graphics file is not yet selected.
  347.  
  348.      5.8.  File .TRR can't open
  349.      This message appears during recognition when there are no
  350. rus.trr or eng.trr files in the current directory.
  351.  
  352.      5.9.  Insufficient memory
  353.      The message warns you that the RAM space for  the program
  354. is not enough. In this event, you need to delete, if possible,
  355. some resident routines the system can do without.
  356.  
  357.      5.10. Recognition is completed
  358.      The message is possible in the following cases:  the file
  359. contains some non-text elements of great  vertical  size;  the
  360. size of the character is too great; two or more adjacent lines
  361. have merged or overlapped; the lines of the inputted image and
  362. the  higher  (lower)  edge  of the sheet of paper are far from
  363. being parallel.
  364.  
  365.      In addition to the above mentioned messages,  some  other
  366. error  messages  may  appear  on the screen (however,  this is
  367. highly improbable).  In such a case,  you need to consult  the
  368. designers  of  the  system  or  their  representative  in your
  369. country.
  370.  
  371.  
  372.                            Appendix
  373.  
  374.             Alternative ASCII code used by InterRec system
  375.  
  376. ┌───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┐
  377. │ Ç │ ü │ é │ â │ ä │ à │ å │ ç │ ê │ ë │ è │ ï │ î │ ì │ Ä │ Å │
  378. │128│129│130│131│132│133│134│135│136│137│138│139│140│141│142│143│
  379. ├───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┤
  380. │ É │ æ │ Æ │ ô │ ö │ ò │ û │ ù │ ÿ │ Ö │ Ü │ ¢ │ £ │ ¥ │ ₧ │ ƒ │
  381. │144│145│146│147│148│149│150│151│152│153│154│155│156│157│158│159│
  382. ├───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┤
  383. │ á │ í │ ó │ ú │ ñ │ Ñ │ ª │ º │ ¿ │ ⌐ │ ¬ │ ½ │ ¼ │ ¡ │ « │ » │
  384. │160│161│162│163│164│165│166│167│168│169│170│171│172│173│174│175│
  385. ├───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┤
  386. │ α │ ß │ Γ │ π │ Σ │ σ │ µ │ τ │ Φ │ Θ │ Ω │ δ │ ∞ │ φ │ ε │ ∩ │
  387. │224│225│226│227│228│229│230│231│232│233│234│235│236│237│238│239│
  388. ├───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┼───┤
  389. │ ≡ │ ± │ ≥ │ ≤ │ ⌠ │ ⌡ │ ÷ │ ≈ │ ° │ ∙ │ · │ √ │ ⁿ │ ² │ ■ │   │
  390. │240│241│242│243│244│245│246│247│248│249│250│251│252│253│254│255│
  391. └───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┘
  392.